o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦 o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦 关键词: AI,o3,AI玩游戏,Lmgame Bench,UCSD UCSD等推出Lmgame Bench标准框架,结合多款经典游戏,分模块测评模型的感知、记忆与推理表现。结果显示,不同模型在各游戏中表现迥异,凸显游戏作为AI评估工具的独特价值。 来自主题: AI资讯 5523 点击 2025-07-01 16:15